دسته بندی متون با روش یادگیری فعال

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس
  • نویسنده پریسا کردجمشیدی
  • استاد راهنما سعید جلیلی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1381
چکیده

امروزه با توجه به رشد روزافزون دسترسی به اسناد الکترونیکی از منابع مختلف، برای استفاده هر چه مفیدتر و دسترسی آسان به اسناد مطلوب، مساله دسته بندی خودکار اهمیت ویژه ای یافته است. این مساله هر چند در حوزه بازیابی اطلاعات قرار دارد اما روشهایی که در این زمینه بکار برده می شوند، روشهای هدایت شده یادگیری ماشین هستند.معمولا در این روشها، ساختن یک دسته بند با کارایی بالا نیاز به نمونه های برچسب خورده فراوانی دارد و این مستلزم صرف نیروی انسانی زیادی است که بسیار پر هزینه است. دراین تحقیق ضمن بررسی روشهای کلی دسته بندی متون و یادگیری فعال، دسته بندی پیشنهادشده است که در آن ابتدا یک دسته بند بیزین ساده اولیه با تعداد خیلی کمی اسناد برچسب دار ساخته می شود . سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری براساس عدم اطمینان به همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها به صورت هدفمند ، نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

متن کامل

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

متن کامل

ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی

امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت وی‍‍ژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندها...

متن کامل

افزایش کارائی دسته بندی متون بر اساس بهبود روش انتخاب خصیصه

در دسته بندی متون معمولا از کلمات به عنوان خصیصه استفاده می شود. از آنجا که در هر مجموعه متون، تعداد بسیار زیادی خصیصه وجود دارد، در این مقاله روش هائی به منظور کاهش تعداد خصیصه ها و انتخاب خصیصه های مرتبط، پیشنهاد شده است. به طور کلی روش های فیلتری انتخاب خصیصه از چهار همبستگی مثبت و منفی بین خصیصه های سندها و دسته ها در ضابطه انتخاب خصیصه استفاده می کنند. در روش های پیشنهادی این مقاله ابتدا ک...

متن کامل

معرفی رده جدیدی در دسته بندی تشخیصی سردرد برگرفته از متون پزشکی ایرانی

سابقه و هدف: سردرد یک بیماری شایع و ناتوان کننده است که افراد در تمام سنین را تحت تاثیر قرار داده، منجر به عملکرد کاری پایین، کاهش کیفیت زندگی و تحمیل بار اقتصادی زیاد به جامعه می‌شود. علت شناسی دسته بزرگی از سردردها همچنان ناشناخته باقی مانده است. این مطالعه مروری نشان می‌دهد، گزارشاتی در سرتاسر دنیا از بیمارانی وجود دارد که علاوه بر سردرد از بیماری همراه دیگری نیز رنج می‌برند. در این مقاله دس...

متن کامل

دسته بندی موضوعی متون فارسی بر اساس روش قواعد انجمنی

برای دسته بندی متن از تکنیک های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود. به طور کلی هدف یک دسته بند متون، دسته بندی اسناد در قالب تعداد معینی از دسته های از پیش تعیین شده می باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سوال پاسخ داده خواهد شد که این سند در کدام یک از دسته ها قرار می گیرد. این موضوع می تواند در قالب یک ...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023